Corrigiendo dependencia de prompts en benchmarks LLM: modelo bayesiano con clustering Descubre cómo un modelo bayesiano jerárquico con clustering corrige la dependencia de prompts en benchmarks de LLM, mejorando métricas de rendimiento hasta un 73%. 2026-06-06 · 2 min